\documentclass[a4paper,zihao=-4]{ctexart}
% \documentclass[a4paper,zihao=-4,openright]{ctexart}
% \documentclass[fontset=adobe]{ctexart}
% \documentclass{ctexart}
% \ctexset{fontset=adobe}
%\ctexset{fontset = windowsnew}
% \usepackage[fontset=windows]{ctex}
\usepackage{algorithmic}
\input{style.tex}












%  WWyx: Local PKG------------------------------------------

\usepackage{multirow}
\usepackage{caption}
\usepackage{ulem}
\usepackage{float}
\usepackage{subcaption}
% ----------------------------------------------------------
\xeCJKsetup{AutoFakeSlant={true},AutoFakeBold={true}}

\newtheorem{proof}{\hspace{2em}证明}
% \makeatletter
% \renewenvironment{proof*}[1][\proofname]{\par
%   \pushQED{\qed}%
%   \normalfont\topsep6\p@\@plus6\p@\relax
%   \trivlist\itemsep=\parsep
%   \item[\hskip\labelsep\itshape\hspace{2em}\textbf{#1}]\ignorespaces
% }{%
%   \popQED\endtrivlist\@endpefalse
% }
% \makeatother

\makeatletter
\newenvironment{proofstar}[1][\proofname]{\par
  \pushQED{\qed}%
  \normalfont\topsep6\p@\@plus6\p@\relax
  \trivlist\item\relax
  {\itshape #1\@addpunct{.}}\hspace\labelsep\ignorespaces
}{%
  \popQED\endtrivlist\@endpefalse
}
\makeatother

\captionsetup[figure]{name={图},labelsep=space} 
\captionsetup[table]{name={表},labelsep=space}
% 修改公式编号格式为 (式 X.Y)
% \renewcommand{\theequation}{式~\thesection.\arabic{equation}}



%  
\addbibresource{reference.bib}


\graphicspath{{figures}}

\renewcommand{\title}{基于交通表征学习的路网级自适应交通控制算法研究及应用}
\newcommand{\englishtitle}{Research and Application of Adaptive Traffic Control Algorithms Based on Traffic Representation Learning}
\newcommand{\candidate}{王宇轩}
\newcommand{\candidateEnglish}{Yuxuan Wang}
\newcommand{\supervisor}{皮家甜\ 副教授}
\newcommand{\supervisorEnglish}{Associate Professor Jiatian Pi}

\newcommand{\discipline}{人工智能}
\newcommand{\disciplineEnglish}{Artificial Intelligence}
\newcommand{\school}{重庆国家应用数学中心}
\newcommand{\schoolEnglish}{National Center For Applied Mathematics In Chongqing}
\renewcommand{\today}{二零二五年三月}
\newcommand{\todayEnglish}{March, 2025}



\begin{document}
\input{cover}
\setlength{\baselineskip}{20pt}  % 设置20磅行距，不能放在导言区
\setlength{\parindent}{2em}      % 首行缩进

\newpage\clearpage \fancyhead[R]{\songti\zihao{5}中文摘要}
\begin{center}
{\mbox{}\vskip 1em\hfil\heiti\zihao{3}\title\hfil}
\end{center}
\section*{摘\hskip 1.5em 要}
\addcontentsline{toc}{section}{\hskip -1em\bfseries 中文摘要}% 目录页单独定制页眉

随着智能交通系统的快速发展，自适应交通控制成为提升城市交通效率和安全性的关键。然而，现有方法在交通表征学习和控制策略优化方面仍存在诸多挑战，例如未能充分捕捉交通数据的动态时空依赖关系、难以适应复杂多变的交通环境以及缺乏对多路口协同控制的全局优化能力。针对这些问题，本人主要研究基于交通表征学习的路网级自适应交通控制算法，旨在通过高效的表征学习和智能决策优化，实现交通信号控制的精准化和智能化。

本文的研究内容和贡献具体如下：

（1）在交通表征学习方面，针对传统方法难以建模动态时空依赖关系的问题，提出了一种基于图学习和门控机制的深度表征学习框架。该框架能够动态生成时空图以捕捉交通数据中的复杂依赖关系，并结合自注意力机制对交通状态进行高效编码，为下游控制任务提供高质量的上下文特征表示。通过在真实交通数据集上的实验验证，证明了该框架在表征学习精度和泛化能力上的优越性。

（2）在自适应交通信号控制方面，针对现有方法在多路口协同控制和实时决策中的不足，提出了一种基于强化学习的混合动作空间优化算法。该算法能够同时优化信号相位和时长，避免了传统两阶段优化的局限性，并通过引入随机动作参数掩码和全局状态建模，有效提升了模型在复杂交通场景中的适用性。此外，该算法支持多路口异步决策，能够适应大规模路网的实时控制需求。在多个真实交通数据集上的实验结果表明，所提出的算法在减少车辆延误和提升路网通行效率方面显著优于现有方法。

本文的研究成果为路网级自适应交通控制提供了新的理论支持和技术手段，具有重要的实际应用价值。未来的研究将进一步探索交通表征学习与信号控制的深度融合，以实现更高效、更智能的交通管理系统。
{\vskip 2em \noindent\heiti 关键词：} 时空数据预测，强化学习，混合动作空间，智能交通信号控制









\newpage\clearpage \fancyhead[R]{\zihao{5}英文摘要} 
\begin{center}
	\mbox{}\vskip 1em\bf\zihao{3}\englishtitle
\end{center}
\section*{\bf ABSTRACT}
\addcontentsline{toc}{section}{\hskip -1em\bfseries 英文摘要}

With the rapid development of intelligent transportation systems (ITS), network-level adaptive traffic control has become crucial for improving urban traffic efficiency and safety. However, existing methods still face numerous challenges in traffic representation learning and control strategy optimization, such as the inability to fully capture dynamic spatio-temporal dependencies in traffic data, difficulties in adapting to complex and changing traffic environments, and the lack of global optimization capabilities for multi-intersection collaborative control. To address these issues, this thesis proposes a network-level adaptive traffic control algorithm based on traffic representation learning, aiming to achieve precise and intelligent traffic signal control through efficient representation learning and intelligent decision optimization.

The research content and contributions of this thesis are as follows:

(1) In terms of traffic representation learning, to address the limitations of traditional methods in modeling dynamic spatio-temporal dependencies, a deep representation learning framework based on graph learning and gating mechanisms is proposed. This framework can dynamically generate spatio-temporal graphs to capture complex dependencies in traffic data and efficiently encode traffic states using a self-attention mechanism, providing high-quality contextual feature representations for downstream control tasks. Experimental validation on real-world traffic datasets demonstrates the superiority of the framework in terms of representation learning accuracy and generalization capability.

(2) In terms of adaptive traffic signal control, to address the shortcomings of existing methods in multi-intersection collaborative control and real-time decision-making, a reinforcement learning-based hybrid action space optimization algorithm is proposed. This algorithm can simultaneously optimize signal phases and durations, avoiding the limitations of traditional two-stage optimization. By introducing a random action parameter mask and global state modeling, the algorithm significantly enhances its applicability in complex traffic scenarios. Additionally, the algorithm supports asynchronous decision-making across multiple intersections, making it suitable for real-time control in large-scale road networks. Experimental results on multiple real-world traffic datasets show that the proposed algorithm outperforms existing methods in reducing vehicle delays and improving network traffic efficiency.

The research outcomes of this thesis provide new theoretical support and technical tools for network-level adaptive traffic control, demonstrating significant practical application value. Future research will further explore the deep integration of traffic representation learning and signal control to achieve more efficient and intelligent traffic management systems.

{\vskip 1em \noindent\bfseries Keywords： }Spatio-temporal data prediction, reinforcement learning, hybrid action space, intelligent traffic signal control

\newpage\clearpage \fancyhead[R]{\songti\zihao{5}目录}  % 目录页单独定制页眉
\vspace*{-1.1\baselineskip}
% \addcontentsline{toc}{section}{\hskip -1em\bfseries 目\hspace{2em}录} 
% \addcontentsline{toc}{section}{\hskip -1em\bfseries 目\hspace{2em}录}
\thispagestyle{fancy}
\tableofcontents
\newpage

%\newpage\fancyhead[R]{\songti\zihao{5}符号说明}
%\addcontentsline{toc}{section}{\hskip -1em\bfseries 符号说明}
%\section*{符号说明}
%以下对本文使用的数学符号做如下约定：
%\begin{enumerate}[parsep=0em]
%	\item $\mathbb{R}^n$表示$n$维欧式空间
%	\item $\|\cdot\|$表示欧式距离
%	\item $\varphi$ 表示采样点集
%	\item $\phi:\mathbb{R}\to\mathbb{R}$表示径向基函数
%	\item $s:\mathbb{R}^n\to\mathbb{R}$表示响应面模型
%	\item $\mathbb{B}({x^\star})$表示目标函数处于$x^\star$处的盆谷
%	\item $\mathbb{H}({x^\star})$表示目标函数处于$x^\star$处的峰
%	\item $\mod$表示取余数
%	\item $\big|\{\cdots\}\big|$表示集合中元素数量
%\end{enumerate}

% \newpage \fancyhead[R]{\songti\zihao{5}图表目录}
% \addcontentsline{toc}{section}{\hskip -1em\bfseries 图表目录}
% \listoffigures

% \listoftables

\newpage\pagestyle{fancy}\fancyhead[R]{\songti\zihao{5}\leftmark} % 恢复正文定制页眉


\setcounter{page}{1}
\pagenumbering{arabic}



% 编译
% \input{contents/introduction_src.tex}
\input{contents/1_introduction.tex}
\input{contents/2_related_theories.tex}
\input{contents/3_method_pred.tex}






\newpage
%\section*{参考文献}
\vspace*{-1.1\baselineskip}
\addcontentsline{toc}{section}{\hskip -1em\bfseries 参考文献 }
\fancyhead[R]{\songti\zihao{5}参考文献}  % 参考文献页单独定制页眉
\pagestyle{fancy}

\printbibliography

\newpage
% \appendix
% \input{contents/99_append1.tex}




\fancyhead[R]{\songti\zihao{5}附录}  % 附录页单独定制页眉
\pagestyle{fancy}
\appendix

\vspace*{-1.1\baselineskip}
\section*{附录A 作者攻读硕士学位期间发表论文及科研情况}
\addcontentsline{toc}{section}{\hskip -1em\bfseries 附录：作者攻读硕士学位期间发表论文及科研情况}

\begin{refenumerate}
\item[\text{[1]}] Yuxuan Wang, Zhouyuan Zhang, Shu Pi, Haishan Zhang, and Jiatian Pi. 2025. "Dual-Gated Graph Convolutional Recurrent Unit with Integrated Graph Learning (DG3L): A Novel Recurrent Network Architecture with Dynamic Graph Learning for Spatio-Temporal Predictions" Entropy 27, no. 2: 99.
https://doi.org/10.3390/e27020099
\item[\text{[2]}] Yuxuan Wang, Meng Long, Qiang Wu, Wei Liu, Jiatian Pi, Xinmin Yang. A Parallel Hybrid Action Space Reinforcement Learning Model for Real-world Adaptive Traffic Signal Control. \\
(ArXiv preprint arXiv:2503.14250; IEEE Transactions on Intelligent Transportation Systems: Under Review) 
\item[\text{[3]}] 王宇轩，皮家甜，杨新民. 一种基于数据驱动的多路口自适应交通信号控制方法.  国家发明专利, 202510123708.4
\item[\text{[3]}] 皮家甜，徐进，王宇轩，杨新民，吴昌质，赵宗琴. 一种交通流预测的自适应交通信号控制系统与方法.  国家发明专利, CN202310385798
\item[\text{[4]}] Wang L, Wang Y X, Li J K, et al. Adaptive Traffic Signal Control Method Based on Offline Reinforcement Learning[J]. Applied Sciences, 2024, 14(22): 10165.
\item[\text{[5]}] 横向项目：交通信号优化算法模型科技研发项目
\item[\text{[6]}] 横向项目：基于时序机器学习模型的多场景驾驶风格与意图识别算法研究
\item[\text{[7]}] 重庆市科委科学研究项目，重点：基于机理与数据双驱动的驾驶风格与意图识别方法研究
\item[\text{[8]}] 重庆市科委科学研究项目，重点：基于多目标优化与强化学习的区域自适应交通信号控制研究
\item[\text{[9]}] 国家级竞赛一等奖：“华为杯”第二十届中国研究生数学建模竞赛一等奖
\item[\text{[10]}] 国家级竞赛三等奖：“正大杯”第十三届全国大学生市场调查与分析大赛研究生组总决赛三等奖
\end{refenumerate}

\newpage

\fancyhead[R]{\songti\zihao{5}致谢}  % 附录页单独定制页眉

\vspace*{-1.1\baselineskip}
\section*{致\hskip 1.5em 谢}
\addcontentsline{toc}{section}{\hskip -1em\bfseries 致谢}
% 时光荏苒，尤如白驹过隙。转眼之间三年的研究生生涯即将开始，如今回想起三年求学历程感触良多。在这三年，我不仅收获了专业知识知识与技能，也收获了友谊与生活之道。这一切离不开我导师的指导，我父母和女友的支持以及实验室同门和朋友们的帮助和陪伴。所以我要特别感谢他们。

% 首先我要感觉我的导师，是他给予了我方向。回想起刚入实验室之初，对我所要研究的领域还是知之甚少，面对选择研究方向的无措，面对知识匮乏的尴尬，我的导师没有责怪我，反而非常信任我让我加入数据挖掘小组，与优秀的师兄师姐一起工作，与长安汽车公司工程师一起工作。这一段经历帮助我太多，让我从一个懵懂的新生快速入门，并且到最后收获满满。

% 其次我要感谢我的父母和我的女友，是他们给予我无私的支持。面对我身边很多人已经成家立业的局面，我父母并没有要求我也如他们一般生活，反而从精神和行动上都给予我坚定的支持，供我读研。我远赴外地读研期间，我女友不仅没有和我抱怨异地的辛苦，还给予我行动和情感上的支持。

% 最后我要感谢我实验室同门和我室友等对我有帮助的同学朋友。在我科研进程中难以推进的时候，是他们给予我帮助，协助我完成实验；在我生活中不开心的时候，是他们为我排忧解难，共同面对。在研究生生涯中，我们一起学习，一起推进项目，最终顺利完成任务，产出论文，专利等成果。

% 转眼之间学生生涯将结束，将开启人生中的另一段历程，不管在哪，我都会牢记导师的教导，父母的期盼，同门的帮助以及朋友们的关心，我将带上他们美好的祝福，开启人生中的下一段历程。



\newpage
\section*{\zihao{2}独~创~性~声~明}
\pagenumbering{Roman} % 开启罗马数字页码
\setcounter{page}{5}  % 根据实际页号设定

\zihao{4}本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外，论文中不包含他人已经发表或撰写过的研究成果，也不包含为获得\underline{重庆师范大学}或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明。


\vskip 4em

学位论文作者签名:\hskip 5.3em 签字日期：\hskip 2.4em  年\hskip 1.5em 月\hskip 1.5em 日

\vskip 8em

\section*{\zihao{2}学位论文版权使用授权书}
本学位论文作者完全了解\underline{\hskip 1em 重庆师范大学\hskip 1em}有关保留、使用学位论文的规定，有权保留并向国家有关部门或机构送交论文的复印件和磁盘，允许论文被查阅和借阅。本人授权\underline{\hskip 1em 重庆师范大学\hskip 1em}可以将学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。

\vskip 4em

学位论文作者签名:\hskip 5.3em 签字日期：\hskip 2.4em  年\hskip 1.5em 月\hskip 1.5em 日


\end{document}